Convolutional Neural Networks Based Turkish Text Classification
نویسندگان
چکیده
Bu çalışmada makine öğrenmesi teknikleri ve konvolüsyonel sinir ağları (KSA) tabanlı bir derin öğrenme modeli kullanılarak iki farklı Türkçe metin veri kümesi sınıflandırılmıştır. Metin sınıflandırma çalışmasında Rastgele Orman (RO), Naive Bayes (NB), Destek Vektör Makineleri (DVM), K-En Yakın Komşu (KNN) Algoritmaları geliştirilen KSA seçilen kümelerine uygulanmıştır. dilinde kümeleri, sınıf adedi olarak birbirinden yapıda tercih edilmiş böylece kelime vektör boyutunun aynı deney ortamında başarısına etkisi araştırılmıştır. Kelime temsil yöntemi Terim Frekansı-Ters Doküman Frekansı (TF-IDF) belirlenmiş olup, işlemi öncesi uygulanan durdurma kelimeleri filtreleme kök bulma önişlemlerinin de sonuçlarına katkısı değerlendirilmiştir. Ayrıca vektörlerine öznitelik seçimi uygulanarak boyutları düşürülmüş, nihai da sonuçlara Bahsedilen tüm ön işlemlerin birleşimleri ortaya çıkan vektörlerinin sınıflandırması sonucunda doğruluk F1-skor değerleri karşılaştırılmıştır. Karşılaştırmalar her algoritması özelinde ayrı tablolar halinde sunulmuştur. algoritmaların birbiri ile karşılaştırmasını içeren oluşturularak sonuçlar analiz edilmiştir.
منابع مشابه
Medical Text Classification using Convolutional Neural Networks
We present an approach to automatically classify clinical text at a sentence level. We are using deep convolutional neural networks to represent complex features. We train the network on a dataset providing a broad categorization of health information. Through a detailed evaluation, we demonstrate that our method outperforms several approaches widely used in natural language processing tasks by...
متن کاملRecurrent Convolutional Neural Networks for Text Classification
Text classification is a foundational task in many NLP applications. Traditional text classifiers often rely on many human-designed features, such as dictionaries, knowledge bases and special tree kernels. In contrast to traditional methods, we introduce a recurrent convolutional neural network for text classification without human-designed features. In our model, we apply a recurrent structure...
متن کاملRationale-Augmented Convolutional Neural Networks for Text Classification
We present a new Convolutional Neural Network (CNN) model for text classification that jointly exploits labels on documents and their constituent sentences. Specifically, we consider scenarios in which annotators explicitly mark sentences (or snippets) that support their overall document categorization, i.e., they provide rationales. Our model exploits such supervision via a hierarchical approa...
متن کاملCancer Hallmark Text Classification Using Convolutional Neural Networks
Methods based on deep learning approaches have recently achieved state-of-the-art performance in a range of machine learning tasks and are increasingly applied to natural language processing (NLP). Despite strong results in various established NLP tasks involving general domain texts, there is only limited work applying these models to biomedical NLP. In this paper, we consider a Convolutional ...
متن کاملSequential Short-Text Classification with Recurrent and Convolutional Neural Networks
Recent approaches based on artificial neural networks (ANNs) have shown promising results for short-text classification. However, many short texts occur in sequences (e.g., sentences in a document or utterances in a dialog), and most existing ANN-based systems do not leverage the preceding short texts when classifying a subsequent one. In this work, we present a model based on recurrent neural ...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ژورنال
عنوان ژورنال: INTERNATIONAL JOURNAL OF INFORMATICS TECHNOLOGIES
سال: 2023
ISSN: ['1307-9697', '2147-0715']
DOI: https://doi.org/10.17671/gazibtd.1165291